22 Glossário
Agent: Sistema de IA que pode executar ações autonomamente, frequentemente utilizando LLMs como cérebro.
Alignment (Alinhamento): O processo de garantir que os comportamentos de um modelo de IA estejam alinhados com as intenções e valores humanos.
Attention Mechanism (Mecanismo de Atenção): Técnica que permite ao modelo prestar atenção seletivamente a diferentes partes da entrada ao processar cada elemento.
BERT: Modelo baseado em codificador, desenvolvido pelo Google,notable for understanding tasks.
Chain-of-Thought (Cadeia de Pensamento): Técnica de prompting que incentiva o modelo a mostrar seu raciocínio intermediário.
Context Window (Janela de Contexto): Quantidade máxima de texto que o modelo pode processar simultaneamente.
Decoder: Componente do Transformer que gera sequências token por token.
Embedding: Representação vetorial densa de tokens que captura relações semânticas.
Fine-tuning: Ajuste fino de um modelo pré-treinado para um domínio ou tarefa específica.
Flash Attention: Técnica para acelerar o cálculo de atenção reduzindo a memória necessária.
Generative AI (IA Generativa): Sistemas de IA capazes de criar conteúdo novo, incluindo texto, imagens, áudio e código.
Gradient: Vetor de derivadas parciais que indica a direção de maior aumento de uma função de perda.
Hallucination (Alucinação): Quando um modelo gera informação incorreta ou fabricada com aparente confiança.
Inference: Processo de usar um modelo treinado para fazer previsões ou gerar conteúdo.
In-Context Learning: Capacidade de um modelo de aprender de exemplos fornecidos no prompt sem ajustar pesos.
LLM (Large Language Model): Modelo de linguagem de grande escala treinado em vastas quantidades de texto.
LoRA (Low-Rank Adaptation): Técnica de fine-tuning eficiente que adiciona adaptadores de baixo posto.
Multimodal: Capacidade de processar múltiplas modalidades de dados, como texto e imagens.
NLP (Natural Language Processing): Campo da IA focado em processamento e compreensão de linguagem natural.
Parameter (Parâmetro): Valor ajustável em uma rede neural que é aprendido durante o treinamento.
Prompt: Entrada de texto fornecida ao modelo para elicitar uma resposta.
Quantization: Técnica para reduzir a precisão numérica dos pesos do modelo, diminuindo requisitos de memória.
Retrieval-Augmented Generation (RAG): Abordagem que combina LLMs com busca em bases de conhecimento externas.
RLHF (Reinforcement Learning from Human Feedback): Técnica de alinhamento usando feedback humano.
Self-Attention (Auto-Atenção): Mecanismo de atenção onde queries, keys e values vêm da mesma sequência.
Temperature: Parâmetro que controla a aleatoriedade da geração de texto.
Token: Unidade básica de texto processada pelo modelo.
Tokenization: Processo de converter texto em sequência de tokens.
Top-k/Top-p Sampling: Técnicas para limitar a aleatoriedade na seleção de tokens.
Transformer: Arquitetura neural baseada em mecanismos de atenção que revolucionou o NLP.
Vanilla Transformers: Versão original do Transformer com codificador e decodificador.